智能论文笔记

Representation Learning of Knowledge Graph for Wireless Communication Networks

Shiwen He , Yeyu Ou , Liangpeng Wang , Hang Zhan , Peng Ren , Yongming Huang

分类：机器学习 | 人工智能

2022-08-22

随着第五代无线通信技术的应用，正在使用更多的智能终端并生成大量数据，这引发了有关如何处理和利用这些无线数据的广泛研究。目前，研究人员专注于有关上层应用程序数据的研究或研究基于蒙特卡洛模拟产生的大量数据的特定问题的智能传输方法。本文旨在通过根据无线通信协议构建知识图以及领域专家知识并进一步研究无线内源性智能来了解无线数据的内源关系。我们首先构建了通过5G/B5G测试网络收集的无线核心网络数据的内源性因素的知识图。然后，基于图形卷积神经网络的新型模型旨在学习图表的表示，该图表用于对图节点进行分类和模拟关系预测。提出的模型实现了自动节点分类和网络异常引起的跟踪。它也以无监督的方式应用于公共数据集。最后，结果表明，所提出的模型的分类精度比现有的无监督图神经网络模型（例如VGAE和ARVGE）更好。

translated by 谷歌翻译

Unsupervised Recurrent Federated Learning for Edge Popularity Prediction in Privacy-Preserving Mobile Edge Computing Networks

Chong Zheng , Shengheng Liu , Yongming Huang , Wei Zhang , Luxi Yang

分类：人工智能 | 机器学习

2022-07-02

如今，无线通信正在迅速重塑整个行业。特别是，移动边缘计算（MEC）是一种用于工业互联网（IIOT）的促成技术，它使强大的计算/存储基础架构更靠近移动终端，从而大大降低了响应延迟。为了获得在网络边缘积极缓存的好处，对最终设备之间的受欢迎程度的精确知识至关重要。但是，在许多IIOT场景中，内容流行的内容流行以及数据私人关系的复杂性质对其获取构成了艰巨的挑战。在本文中，我们建议针对MEC启用的IIOT提供无监督和保护隐私的普及预测框架。引入了本地和全球流行的概念，并将每个用户的随时间变化为无模型的马尔可夫链。在此基础上，提出了一种新颖的无监督的复发性联合学习（URFL）算法，以预测分布式的流行，同时实现隐私保护和无监督的培训。仿真表明，提出的框架可以根据降低的根平方误差提高预测准确性，高达$ 60.5 \％-68.7 \％$。此外，避免了手动标签和违反用户数据隐私的行为。

translated by 谷歌翻译

SurroundDepth: Entangling Surrounding Views for Self-Supervised Multi-Camera Depth Estimation

Yi Wei , Linqing Zhao , Wenzhao Zheng , Zheng Zhu , Yongming Rao , Guan Huang , Jiwen Lu , Jie Zhou

分类：计算机视觉

2022-04-07

图像的深度估计是自动驾驶3D感知的基本步骤，并且是LIDAR等昂贵深度传感器的经济替代方案。时间光度限制可实现无标签的自制深度估计，从而进一步促进其应用。但是，大多数现有方法仅根据每个单眼图像来预测深度，并忽略多个周围相机之间的相关性，这些相机通常可用于现代自动驾驶车辆。在本文中，我们提出了一种环绕方法，以合并来自多个周围视图的信息，以预测跨相机的深度图。具体来说，我们采用联合网络来处理所有周围的观点，并提出跨视图变压器，从多个视图中有效融合信息。我们应用跨视图自我注意力，有效地实现多相机特征图之间的全局相互作用。与自我监督的单眼深度估计不同，我们能够预测给定多相机外部矩阵的现实世界量表。为了实现这一目标，我们采用了两框结构，从而提取尺度感知的伪深度以预处理模型。此外，我们没有预测每个摄像机的自我运动，而是估计车辆的普遍自我运动并将其传输到每种视图中以实现多视图的自我运动一致性。在实验中，我们的方法在具有挑战性的多相机深度估计数据集DDAD和NUSCENES上实现了最新的性能。

translated by 谷歌翻译

DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting

Yongming Rao , Wenliang Zhao , Guangyi Chen , Yansong Tang , Zheng Zhu , Guan Huang , Jie Zhou , Jiwen Lu

分类：计算机视觉 | 人工智能 | 机器学习

2021-12-02

最近的进展表明，使用对比图像文本对的大规模预训练可以是从自然语言监督的高质量视觉表演学习的有前途的替代方案。从更广泛的监督来源受益，这种新的范例展示了对下游分类任务和数据集的令人印象深刻的可转移性。然而，从图像文本对中学习的知识转移到更复杂的密集预测任务的问题几乎没有访问过。在这项工作中，我们通过隐式和明确地利用来自剪辑的预先训练的知识来提出了一种新的密集预测框架。具体地，我们将剪辑中的原始图像文本匹配问题转换为像素文本匹配问题，并使用像素文本分数图来指导致密预测模型的学习。通过进一步使用图像中的上下文信息来提示语言模型，我们能够促进我们的模型来更好地利用预先接受训练的知识。我们的方法是模型 - 不可行的，它可以应用于任意密集的预测系统和各种预先训练的视觉底座，包括夹模型和想象成预先训练的模型。广泛的实验证明了我们对语义分割，对象检测和实例分段任务的方法的卓越性能。代码可在https://github.com/raoyongming/denseclip获得

translated by 谷歌翻译

Point-BERT: Pre-training 3D Point Cloud Transformers with Masked Point Modeling

Xumin Yu , Lulu Tang , Yongming Rao , Tiejun Huang , Jie Zhou , Jiwen Lu

分类：计算机视觉 | 人工智能 | 机器学习

2021-11-29

我们呈现Point-Bert，一种用于学习变压器的新范式，以概括BERT对3D点云的概念。灵感来自BERT，我们将屏蔽点建模（MPM）任务设计为预列火车点云变压器。具体地，我们首先将点云划分为几个本地点修补程序，并且具有离散变化性AutoEncoder（DVAE）的点云标记器被设计为生成包含有意义的本地信息的离散点令牌。然后，我们随机掩盖了一些输入点云的补丁并将它们送入骨干变压器。预训练目标是在销售器获得的点代币的监督下恢复蒙面地点的原始点令牌。广泛的实验表明，拟议的BERT风格的预训练策略显着提高了标准点云变压器的性能。配备了我们的预培训策略，我们表明，纯变压器架构对ModelNet40的准确性为93.8％，在ScanObjectnn的最艰难的设置上的准确性为83.1％，超越精心设计的点云模型，手工制作的设计更少。我们还证明，Point-Bert从新的任务和域中获悉的表示，我们的模型在很大程度上推动了几个射击点云分类任务的最先进。代码和预先训练的型号可在https://github.com/lulutang0608/pint -bert上获得

translated by 谷歌翻译

Distributed Reinforcement Learning for Privacy-Preserving Dynamic Edge Caching

Shengheng Liu , Chong Zheng , Yongming Huang , Tony Q. S. Quek

分类：机器学习 | 人工智能

2021-10-20

移动边缘计算（MEC）是一个突出的计算范例，它扩展了无线通信的应用领域。由于用户设备和MEC服务器的能力的限制，边缘缓存（EC）优化对于有效利用启用MEC的无线网络中的高速利用。然而，内容普及空间和时间的动态和复杂性以及用户的隐私保护对EC优化构成了重大挑战。在本文中，提出了一种隐私保留的分布式深度确定性政策梯度（P2D3PG）算法，以最大化MEC网络中设备的高速缓存命中率。具体而言，我们认为内容流行度是动态，复杂和不可观察的事实，并制定了在隐私保存的限制下作为分布式问题的设备的高速缓存命中速率的最大化。特别是，我们将分布式优化转换为分布式的无模型马尔可夫决策过程问题，然后介绍一种隐私保留的联合学习方法，用于普及预测。随后，基于分布式增强学学习开发了P2D3PG算法以解决分布式问题。仿真结果表明，在保护用户隐私的同时通过基线方法提高EC击中率的提出方法的优越性。

translated by 谷歌翻译

RPN: A Word Vector Level Data Augmentation Algorithm in Deep Learning for Language Understanding

Zhengqing Yuan , Zhuanzhe Zhao , Yongming Liu , Xiaolong Zhang , Xuecong Hou , Yue Wang

分类：自然语言处理 | 人工智能

2022-12-12

This paper presents a new data augmentation algorithm for natural understanding tasks, called RPN:Random Position Noise algorithm.Due to the relative paucity of current text augmentation methods. Few of the extant methods apply to natural language understanding tasks for all sentence-level tasks.RPN applies the traditional augmentation on the original text to the word vector level. The RPN algorithm makes a substitution in one or several dimensions of some word vectors. As a result, the RPN can introduce a certain degree of perturbation to the sample and can adjust the range of perturbation on different tasks. The augmented samples are then used to give the model training.This makes the model more robust. In subsequent experiments, we found that adding RPN to the training or fine-tuning model resulted in a stable boost on all 8 natural language processing tasks, including TweetEval, CoLA, and SST-2 datasets, and more significant improvements than other data augmentation algorithms.The RPN algorithm applies to all sentence-level tasks for language understanding and is used in any deep learning model with a word embedding layer.

translated by 谷歌翻译

FLAG3D: A 3D Fitness Activity Dataset with Language Instruction

Yansong Tang , Jinpeng Liu , Aoyang Liu , Bin Yang , Wenxun Dai , Yongming Rao , Jiwen Lu , Jie Zhou , Xiu Li

分类：计算机视觉

2022-12-09

With the continuously thriving popularity around the world, fitness activity analytic has become an emerging research topic in computer vision. While a variety of new tasks and algorithms have been proposed recently, there are growing hunger for data resources involved in high-quality data, fine-grained labels, and diverse environments. In this paper, we present FLAG3D, a large-scale 3D fitness activity dataset with language instruction containing 180K sequences of 60 categories. FLAG3D features the following three aspects: 1) accurate and dense 3D human pose captured from advanced MoCap system to handle the complex activity and large movement, 2) detailed and professional language instruction to describe how to perform a specific activity, 3) versatile video resources from a high-tech MoCap system, rendering software, and cost-effective smartphones in natural environments. Extensive experiments and in-depth analysis show that FLAG3D contributes great research value for various challenges, such as cross-domain human action recognition, dynamic human mesh recovery, and language-guided human action generation. Our dataset and source code will be publicly available at https://andytang15.github.io/FLAG3D.

translated by 谷歌翻译

Neural Optimization Machine: A Neural Network Approach for Optimization

Jie Chen , Yongming Liu

分类： (统计)机器学习 | 机器学习

2022-08-08

提出了一种新型的神经网络（NN）方法，以进行约束优化。所提出的方法使用特殊设计的NN体系结构和培训/优化程序，称为神经优化机（NOM）。 NN模型近似NOM的目标函数。优化过程由神经网络的内置反向传播算法进行。 NOM通过扩展NN目标函数模型的体系结构来解决优化问题。这是通过适当设计NOM的结构，激活函数和损耗函数来实现的。 NN目标函数可以具有任意体系结构和激活功能。 NOM的应用不仅限于特定的优化问题，例如线性和二次编程。结果表明，设计变量的维度的增加不会大大增加计算成本。然后，将NOM扩展为多目标优化。最后，使用数值优化问题对NOM进行测试，并应用于加成制造中处理参数的最佳设计。

translated by 谷歌翻译

P2P: Tuning Pre-trained Image Models for Point Cloud Analysis with Point-to-Pixel Prompting

Ziyi Wang , Xumin Yu , Yongming Rao , Jie Zhou , Jiwen Lu

分类：计算机视觉 | 人工智能 | 机器学习

2022-08-04

如今，大规模数据集的大型培训大型模型已成为深度学习的关键主题。具有较高表示能力和可传递性的预训练模型取得了巨大的成功，并在自然语言处理和2D视觉中占据了许多下游任务。但是，鉴于有限的训练数据相对不便，因此将这种预处理的调整范式促进这种预处理的调整范式是非平凡的。在本文中，我们提供了一个新的观点，即利用3D域中的预训练的2D知识来解决此问题，以新颖的点对像素来调整预训练的图像模型，以较小的参数成本提示点云分析。遵循促使工程的原理，我们将点云转换为具有几何形状的投影和几何学吸引着色的色彩图像，以适应预训练的图像模型，在点云分析的端到端优化期间，其权重冻结了任务。我们进行了广泛的实验，以证明与提议的点对像素提示合作，更好的预训练图像模型将导致在3D视觉中始终如一地表现更好的性能。享受图像预训练领域的繁荣发展，我们的方法在Scanobjectnn的最困难环境中获得了89.3％的精度，超过了传统的点云模型，具有较少的可训练参数。我们的框架在模型网分类和塑形部分分割方面还表现出非常具竞争力的性能。代码可从https://github.com/wangzy22/p2p获得

translated by 谷歌翻译